Table of Contents

Исследование основного и дополнительного ассортимента интернет-магазина товаров для дома «Пока все ещё тут»

Материалы:

Цель - выявить основной и дополнительный ассортимент интернет-магазина товаров для дома «Пока все ещё тут»

Основные товары это те, которые входят в группу АА, АВ и ВА по выручке и проданному количеству, а дополнительные товары в остальные категории, кроме категории СС.

Описание данных:

Датасет описывает транзакции интернет-магазина товаров для дома и быта «Пока все ещё тут».

Колонки в ecommerce_dataset.csv :

Обзор данных

В таблице 'df' 6 столбцов, 7 474 строки. В каждой строке информация об одном товаре в заказе пользователя. Типы данных float64(1), int64(3), object(2).

Вывод после обзора данных:

Предварительно можно утверждать, что данных достаточно для анализа.

Предобработка данных

Полных дубликатов и пропусков нет.

У нас есть данные о заказах сделанных с 1 октября 2018 года по 31 января 2020 года.

В датасете были строки, у которых совпадают значения во всех столбцах, кроме даты. Отбросили такие строки, чтобы они не исказили выводы исследования.

В датасете есть заказы, индентификатор которых встречается у двух клиентов одновременно. Такие заказы придется отбросить, поскольку не может быть один заказ у нескольких покупателей.

В столбце с количеством товара есть выбросы до 1000, возможно это оптовые заказы или ошибка при записи данных. Посмотрим на такие заказы подробнее. Для границы возьмем 95 процентиль.

Есть заказ с 1000 вантузов или 170 муляжей яблок, наверняка это оптовые заказы или ошибка в данных, такие заказы могут повлиять на анализ, отбросим такие заказы.

В столбце со стоимостью товаров есть выбросы больше 14000, возможно это дорогие товары или ошибка при записи данных. Посмотрим на них подробнее.

Самый дорогой товар это "сушилка уличная leifheit", это нормальная стоимость для такого рода товаров. Цены остальных товаров тоже примерно соответствуют. Можно предпотоложить, что среди цен нет аномальных значений.

Отбросили заказы с количеством товара больше 95-го процентиля.

Отлично, категории присвоились всем товарам.

Вывод после предобработки

В ходе предобработки мы исследовали дубликаты и пропуски, соответствие типов данных и значений столбцов, аномальные значения, выделили товарные категории.

Полных дубликатов и пропусков не обнаружили. Удалили неявные дубликаты, то есть заказы у которых совпадали все столбцы, кроме даты. Привели столбец с датой в тип datetime. Удалили заказы, у которых было несколько покупателей. Удалили аномальные значения количества товаров. Выделили 6 товарных категорий и распределили товары по этим категориям.

Данные готовы к анализу.

Исследовательский анализ данных

Продажи по категориям

Построим графики для наглядности.

Больше всего выручки принесли товары из категории "Предметы для хранения и переноски", меньше всего "Предметы для уборки"

По количеству проданных товаров лидирует "Растения и цветы", но по выручке они на втором месте. Их продается много, но они не такие дорогие, как "Предметы для хранения и переноски", которые лидирут по выручке.

Категория "Различные предметы" по количеству продается меньше, чем категория "Растения и цветы", но выручки генерирует одинаково с ней.

Предметы для уборки и по выручке и по количеству на последнем месте.

На графике видно, как растет выручка у категории "Растения и цветы" в апреле-мае, возможно это связано с подготовкой к дачному сезону.

Выручка категории "Предметы для хранения и переноски" имеет достигает своего пика в октябре 2018, но также имеет локальные пики в декабре, феврале, июле. Провалы в выручке наблюдаются в январе, ноябре, мае и июне.

Остальные категории держатся более стабильно на протяжении года.

На графике видно, как начиная с февраля резко растет количество проданных растений и достигает своего пика в мае, после чего снижается. Можно предположить что в апреле-мае начинается подготовка к дачному сезону и продажи растений растут.

Остальные категории ведут себя относительно стабильно на протяжении всего года по сревнению с растениями.

Выводы:

Больше всего выручки приносят товары из категории "Предметы для хранения и переноски".

По количеству проданных товаров лидирует "Растения и цветы", но по выручке они на втором месте. Можно сделать вывод, что их продается много, но они не такие дорогие, как "Предметы для хранения и переноски", которые лидирут по выручке.

В мае выручка и количество проданных товаров категории "Растения и цветы" достигает пика и сильно выше всех остальных категорий, возможно это связано с подготовкой к дачному сезону.

Выручка категории "Предметы для хранения и переноски" имеет достигает своего пика в августе, но также имеет локальные пики в феврале, октябре и декабре.

Категория "Различные предметы" по количеству продается меньше по количеству, чем категория "Предметы для кухни", но выручки генерирует одинаково с ней.

Предметы для уборки и по выручке и по количеству на последнем месте.

Остальные категории держатся стабильно на протяжении года.

Продажи по месяцам

Построим график для наглядности.

Выручка постепенно снижается. Самая высокая выручка была в октябре 2018 года около 185 000, а в октябре 2019 года уже около 92 000.

Построим графики для наглядности.

Больше всего заказов в феврале и декабре и апреле. Меньше всего в июне, июле и мае.

Самая большая выручка в октябре, январе и апреле. Меньше всего в июне, августе и январе.

Больше всего проданных товаров в апреле и мае. Меньше всего проданных товаров в августе, январе и сентябре.

Выводы:

Больше всего заказов в феврале и декабре и апреле. Меньше всего в июне, июле и мае.

Самая большая выручка в октябре, январе и апреле. При этом количество заказов и проданных товаров в октябре не самое высокое, можно предположить, что это связано с высокими продажами в октябре 2018 года. Меньше всего выручка в июне, августе и январе.

Больше всего проданных товаров в апреле и мае, как мы уже выяснили, это связано с пиком спроса на растения и цветы. Меньше всего проданных товаров в августе, январе и сентябре.

Продажи по дням недели

Построим графики для наглядности.

Больше всего выручка и количество заказов в понедельник и плавно снижается до субботы, а в воскресенье начинает расти.

Больше всего количество проданных товаров в понедельник, четверг и вторник. Меньше всего в субботу, воскресенье и пятницу.

Выводы:

Больше всего выручка и количество заказов в понедельник и плавно снижается до субботы, а в воскресенье начинает расти.

Больше всего количество проданных товаров в понедельник, четверг и вторник. Меньше всего в субботу, воскресенье и пятницу.

Продажи по часам

Построим графики для наглядности.

Количество заказов плавно растет с 4 утра и достигает пика в 12 часов, далее постепенно снижается до 3 утра.

Выручка плавно растет в течении дня с 5 утра и достигает пика в 11 часов дня, далее плавно снижается до 4 утра.

Больше всего товаров заказывают в 13 часов, меньше всего в 3 часа ночи.

Вывод:

Основные заказы приходят с 8 утра до 11 вечера. Пик заказов приходится на 12 часов, выручки на 11 часов, количества товаров на 13 часов. Меньше всего заказов и количества товаров в 3 утра. А выручки меньше всего в 4 часа утра.

Выводы после исследовательского анализа данных

Мы проанализировали продажи интернет-магазина товаров для дома и быта «Пока все ещё тут» по категориям, месяцам, дням недели и часам.

Исходя из проведенного исследования, можно сделать следующие общие выводы по исследованию продаж интернет-магазина:

  1. Категория "Предметы для хранения и переноски" приносит наибольшую выручку, в то время как категория "Растения и цветы" лидирует по количеству проданных товаров. Это указывает на то, что "Растения и цветы" имеют более низкую цену в сравнении с "Предметами для хранения и переноски".
  2. В мае выручка и количество проданных товаров категории "Растения и цветы" достигают пика, что может быть связано с подготовкой к дачному сезону. А выручка категории "Предметы для хранения и переноски" имеет пик в августе, с локальными пиками в феврале, октябре и декабре.
  3. Категория "Различные предметы" имеет меньшее количество продаж по сравнению с категорией "Предметы для кухни", но генерирует одинаковую выручку. Предметы для уборки находятся на последнем месте как по выручке, так и по количеству проданных товаров.
  4. Общее количество заказов имеет пики в феврале, декабре и апреле, а самая высокая выручка наблюдается в октябре, январе и апреле. Однако, в октябре выручка высока, несмотря на не самое высокое количество заказов, возможно, из-за высоких продаж в октябре 2018 года. Наименьшая выручка наблюдается в июне, августе и январе.
  5. Самое большое количество проданных товаров приходится на апрель и май, что связано с пиком спроса на растения и цветы. Меньше всего продаж происходит в августе, январе и сентябре.
  6. В течение недели наибольшая выручка и количество заказов наблюдаются в понедельник, а затем плавно снижаются до субботы, после чего начинают расти в воскресенье. Наибольшее количество проданных товаров приходится на понедельник, четверг и вторник, а наименьшее - на субботу, воскресенье и пятницу.
  7. Основные заказы осуществляются с 8 утра до 11 вечера, с пиком заказов в 12 часов. Наименьшее количество заказов наблюдается в 3 утра.

Эти выводы могут помочь интернет-магазину оптимизировать свою стратегию продаж, учитывая популярность категорий товаров, пики спроса в определенные месяцы и дни недели, а также время, когда осуществляются основные заказы.

Анализ основного и дополнительного ассортимента

АВС анализ

Для выделения основного и дополнительного ассортимента проведем АВС анализ по выручке и количеству проданных товаров.

ABC анализ позволяет рассортировать список товаров на три группы, которые оказывают разное влияние на выручку или количество проданных товаров.

После распределения товаров на группы по выручке и по количеству объеденим их группы и у нас получится группы АА, АВ, АС, ВА и так далее. Группу АА будем считать основным ассортиментом, она продается лучше всего. Все остальные группы, кроме СС, будем считать дополнительным ассортиментом. Группу СС, то есть товары которые продаются хуже всего выделим отдельно, возможно это новые товары и они еще не успели набрать достаточно продаж.

Анализ основного ассортимента

В основной ассортименте у нас 842 товар из 2071. Это наиболее важные товары, нужно следить чтобы они всегда были на складе, а также обеспечивать им рекламную поддержку.

Большая часть товаров в оснавном ассортименте находится в категории "Предметы для хранения и переноски", на втором месте "Растения и цветы"

Анализ дополнительного ассортимента

В дополнительном ассортименте у нас 1661 товар, этот товар генерирует меньше выручки, чем оснавной ассортимент, но за ним тоже нужно следить, чтоб были запасы на складе.

Почти половина товаров дополнительного ассортимента находится в категории "Растения и цветы".

Анализ неликвидного ассортимента

207 товаров не попали в основной или дополнительный ассортимент, эти товары генерируют только 5% выручки. Это либо новые или сезонные товары, либо товары аутсайдеры. Если это товары аутсайдеры, то нужно исключить их из ассортимента и замените на новые позиции. Если убрать из ассортимента не получится, то следует поискать все возможные пути для снижения себестоимости.

По большей части неликвидные товары из категории "Растения и цветы", возможно их положение связано с сезонным спросом на такие товары.

Выводы после анализа основного и дополнительного ассортимента

Мы проанализировали ассортимент интернет-магазина товаров для дома и быта «Пока все ещё тут» методом АВС и разделили ассортимент на основной, дополнительный и нелеквидный.

Исходя из проведенного исследования ассортимента интернет-магазина, можно сделать следующие выводы:

  1. Основной ассортимент магазина составляет 842 товар. Этот ассортимент генерирует основную часть выручки и требует постоянного контроля и управления.
  2. Дополнительный ассортимент состоит из 1661 товара. Хотя этот ассортимент приносит меньше выручки, его также необходимо следить и поддерживать на складе, чтобы удовлетворить потребности клиентов.
  3. 207 товаров составляют неликвидную часть ассортимента. Таким образом 5% выручки приходится на товары, которые либо новые, либо сезонные, либо являются аутсайдерами. Если это товары аутсайдеры, то рекомендуется исключить их из ассортимента и заменить на новые позиции. Если удаление из ассортимента не является возможным, то следует искать пути для снижения себестоимости этих товаров.
  4. Категория "Растения и цветы" содержит большую часть неликвидных товаров. Это может быть связано с сезонным спросом на эти товары или другими факторами. Важно провести анализ и определить причины неликвидности, чтобы принять соответствующие меры, такие как снижение себестоимости или замена товаров в этой категории.

Интернет-магазину следует активно управлять своим ассортиментом, обращая внимание на основной и дополнительный ассортимент, а также на товары, которые приносят небольшую выручку или являются неликвидными. Это поможет оптимизировать стратегию продаж и обеспечить удовлетворение потребностей клиентов.

Статистический анализ данных

Анализ различий средних чеков в октябре 2018 и в октябре 2019 года

Сформулируем гипотезы.

H_0: Средний чек заказов сделанных в октябре 2018 года = средний чек заказов сделанных в октябре 2019 года

H_a: Средний чек заказов сделанных в октябре 2018 года ≠ средний чек заказов сделанных в октябре 2019 года

alpha = 0.05

Отвергаем нулевую гипотезу, есть статистически значимое различие между средними чеками в октябре 2018 и в октябре 2019 года.

Анализ различий среднего количества товаров заказанных в январе 2019 и в январе 2020 года

Сформулируем гипотезы.

H_0: Количество товаров заказанных в январе 2019 = количество товаров заказанных в январе 2020 года

H_a: Количество товаров заказанных в январе 2019 ≠ количество товаров заказанных в январе 2020 года

alpha = 0.05

Отвергаем нулевую гипотезу, есть статистически значимое различие между средним количеством товаров заказанных в январе 2019 и в январе 2020 года.

Выводы после статистического анализа

Мы проверили две статистические гипотезы.

  1. О различии средних чеков в октябре 2018 и в октябре 2019 года. - Есть статистически значимое различие между средними чеками в октябре 2018 и в октябре 2019 года

  2. О различии среднего количества товаров заказанных в январе 2019 и в январе 2020 года. - Есть статистически значимое различие между средним количеством товаров заказанных в январе 2019 и в январе 2020 года

Вывод по исследованию

1. Мы проанализировали продажи интернет-магазина товаров для дома и быта «Пока все ещё тут» по категориям, месяцам, дням недели и часам.

Исходя из проведенного исследования, можно сделать следующие общие выводы по исследованию продаж интернет-магазина:

2. Мы проанализировали ассортимент интернет-магазина товаров для дома и быта «Пока все ещё тут» методом АВС и разделили ассортимент на основной, дополнительный и нелеквидный.

Исходя из проведенного исследования ассортимента интернет-магазина, можно сделать следующие выводы:

Интернет-магазину следует активно управлять своим ассортиментом, обращая внимание на основной и дополнительный ассортимент, а также на товары, которые приносят небольшую выручку или являются неликвидными. Это поможет оптимизировать стратегию продаж и обеспечить удовлетворение потребностей клиентов.

3. Мы проверили две статистические гипотезы.